Format fail Protein Data Bank

Format fail yang pada mulanya digunakan oleh PDB dipanggil format fail PDB. Format asal dihadkan oleh lebar kad tebuk komputer kepada 80 aksara setiap baris. Sekitar tahun 1996, format "fail maklumat kristalografi makromolekul", mmCIF, format lanjutan CIF telah diguna pakai secara berperingkat. mmCIF menjadi format piawai arkib PDB pada tahun 2014.[19] Pada 2019, wwPDB mengumumkan bahawa pengumpulan untuk kaedah kristalografi hanya akan diterima dalam format mmCIF.[20]

Versi XML PDB, dipanggil PDBML, telah diterangkan pada tahun 2005.[21] Fail struktur boleh dimuat turun dalam mana-mana daripada tiga format ini, walaupun semakin banyak struktur tidak sesuai dengan format PDB warisan. Fail individu mudah dimuat turun ke dalam pakej grafik daripada URL Internet:

  • Untuk fail format PDB, gunakan, cth.,http://www.pdb.org/pdb/files/4hhb.pdb.gz atauhttp://pdbe.org/download/4hhb
  • Untuk fail PDBML (XML), gunakan, cth.,http://www.pdb.org/pdb/files/4hhb.xml.gz atauhttp://pdbe.org/pdbml/4hhb

"4hhb" ialah pengecam PDB. Setiap struktur yang diterbitkan dalam PDB menerima pengecam huruf-nombor empat aksara, ID PDBnya. (Ini bukan pengecam unik biomolekul, kerana beberapa struktur bagi molekul yang sama—dalam persekitaran atau konformasi yang berbeza—mungkin terkandung dalam PDB dengan ID PDB yang berbeza.)